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Abstract 

Round-trip times (RTTs) are an important metric for 

the operation of many applications in the Internet. For 
instance, they are taken into account when choosing ser- 
vers or peers in streaming systems, and they impact the 
operation of fault detectors and congestion control algo- 
rithms. Therefore, detailed knowledge about RTTs is im- 
portant for application and protocol developers. In this 
work we present results on measuring RTTs between 81 
PlanetLab nodes every ten seconds, for ten days. The re- 
sulting dataset has over 550 million measurements. Our 
analysis gives us a profile of delays in the network and 
identifies a Gamma distribution as the model that best fits 
our data. The average times observed are below 500 ms 
in more than 99% of the pairs, but there is significant 
variation, not only when we compare different pairs of 
hosts during the experiment, but also considering any gi- 
ven pair of hosts over time. By using a clustering techni- 
que, we observe that links can be divided in five distinct 
groups based on the distribution of RTTs over time and 
the losses observed, ranging from groups of near, well- 
connected pairs, to groups of distant hosts, with lower 
quality links between them. 

Keywords: Round-trip times, RTT, delays, Internet, 
PlanetLab 



Resumo 

Tempos de ida-e-volta (RTTs) sdo uma metrica impor- 

tante para diversas aplicagoes na Internet. For exemplo, 
eles afetam a escolha de servidores ou pares em siste- 
mas de troca de arquivos e de streaming e a operagdo de 
mecanismos de detecgao de falhas e de controle de con- 
ge stionamento. For isso, entender a variagdo de RTTs e 
essencial para o projeto de protocolos e aplicagoes. Neste 
trabalho apresentamos os resultados da medigao de RTTs 
entre 81 nos da rede FlanetLab a cada dez segundos, por 
dez dias. O registro resultante possui cerca de 550 mi- 
Ihdes de medigdes. Nossa andlise nos permite tragar um 
perfil detalhado do atraso na rede e identificar uma dis- 
tribuigdo Gamma como a que melhor aproxima os dados 
coletados. Os tempos medios observados sdo inferiores 
a 500 ms em mais de 99% dos casos, mas a variagdo 
e significativa, ndo so para diferentes pares de mdqui- 
nas, mas tamhem para um mesmo par ao longo do tempo. 
Aplicando uma tecnica de clusterizagdo, verificamos que 
OS enlaces podem ser classificados em cinco grupos com 
base na distribuigdo dos RTTs, sua variagdo e perdas, va- 
riando de grupos de nos proximos conectados a grupos de 
nos distantes com enlaces de menor qualidade. 

Palavras-chave: Tempos de ida-e-volta, RTT, atra- 
sos, Internet, PlanetLab 
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1. INTRODUQAO 

Na Internet atual, muitas aplica9oes dependem de 
informa96es sobre os tempos de ida-e-volta pela rede 
{Round-Trip Times, ou RTT) para certas decis5es. Alem 
de ser essencial para se prever o comportamento de pro- 
tocolos como o TCP, que dependem de estimativas para 
esse valor [7, 1], esses tempos sao importantes para apU- 
cagoes que operam segundo o principio de requisi9ao res- 
posta e que podem escolher entre diversos servidores na 
rede [13], aplicafSes de multicast de audio/video depen- 
dem dessa informa9ao para montar suas arvores de dis- 
tribui9ao [6] e aplica96es par-a-par, que podem se benefi- 
ciar ao escolher como vizinhos nos que respondem mais 
rapido a consultas [3]. Alem disso, essa informa9ao tam- 
bem e usada quando se objetiva reduzir as latencias de 
transmissao, dimensionar buffers na rede e avaliar a banda 
disponivel entre dois hosts [21, 11]. 

Um estudo sobre a distribui9ao de atrasos (unidirecio- 
nais ou de ida-e-volta) e importante para servir como base 
para auxiliar projetistas de protocolos e aplica9oes em seu 
trabalho, ja que fomece dados de referenda para a tomada 
de decis5es. Alem disso, os dados coletados podem servir 
como entrada realista para simula9oes de sistemas distri- 
buidos e como base para o desenvolvimento de modelos 
sinteticos a serem usados em simuladores. 

Segundo Redigolo e outros, dentre os mecanismos de 
obten9ao de conhecimento, o metodo cientifico mostra- 
se, nao apenas como o de exito mais provavel, mas como 
o mais convincente [14]. O empirismo, ceme do me- 
todo cientifico, consiste na investiga9ao controlada de 
um fenomeno, organizada na forma de experimentos. 
Com efeito, os resultados positives de um experimento 
prestam-se ao intuito de comprovar ou ao menos, refor9ar 
uma hipotese formulada e investigada na condugao deste. 

Atraves da utilizagao de um trace na analise de proto- 
colos de rede, possibilita-se a investigagao controlada e a 
repetibilidade dos experimentos, de maneira que compa- 
ragoes de desempenho possam ser realizadas num cenario 
real. Alem disso, uma carga real possibilitaria uma ana- 
lise de desempenho considerando tambem efeitos inespe- 
rados, resultantes da interagao entre sistemas complexes, 
produzindo resultados com alto valor cientifico e validos 
como cenarios reais. 

Tendo esses objetivos em mente, neste trabalho apre- 
sentamos um estudo sobre tempos de ida-e-volta e atra- 
sos unidirecionais na Internet. Medidas de RTT foram 
coletadas entre aproximadamente 100 pontos da rede, a 
cada dez segundos, durante dez dias. Os dados coletados 
foram analisados utilizando ferramentas estatisticas e de 
mineragao de dados, buscando fornecer uma caracteriza- 
9ao detalhada dos dados coletados. 

Analisamos, entre outros aspectos, a distribuigao de 
atrasos e perdas observadas, o nivel de assimetria obser- 
vado durante as medigoes e a existencia de agrupamentos 



de canals de comunicagao com caracteristicas distintas. 
Alem da coleta, analise e disponibilizagao do trace de um 
cenario real, desenvolvemos tambem um modelo sintetico 
para a distribuifao de RTTs. 

Para uma medida precisa de tempos de ida-e-volta e de 
atrasos unidirecionais e necessario acesso aos dois extre- 
mes do canal de comunicagao que se deseja medir, o que 
descarta o uso de aplica9oes usuais que utilizam o pro- 
tocolo ICMP, como o comando ping [8]. Sendo assim, 
utilizamos nos da rede PlanetLab em nossas medifSes, 
tendo o cuidado de selecionar maquinas com uma ampla 
cobertura geografica, localizadas tanto em redes academi- 
cas/de pesquisa quanto em redes comercias. 

Nossos resultados mostram que os RTTs variam signi- 
ficativamente entre pares de maquinas na Internet, como 
seria de se esperar, mas tambem podem variar significa- 
tivamente entre duas maquinas definidas, mesmo em es- 
calas de tempo reduzidas. Apesar da variabilidade, nossa 
analise indica que ha alguns grupos de comportamento 
similar definidos com base nos tipos de canais que as se- 
param. Perdas de pacotes, em geral, sao baixas e tendem 
a se concentrar nos canais com maiores RTTs. 

O restante deste trabalho e organizado da seguinte 
forma: a se9ao a seguir discute conceitos e trabalhos rela- 
cionados, para entao discutirmos o processo de medifao e 
coleta de dados na segao 3. Os resultados sao apresenta- 
dos na se9ao 4, com subse9oes para os principals elemen- 
tos da nossa analise. Finalmente, conclufmos com algu- 
mas observagSes e uma discussao de possiveis trabalhos 
futures. 



2. Trabalhos relacionados 

A avalia9ae de desempenho de um sistema (cemputa- 
cienal) e significativa semente no contexto de uma carga 
de trabalho, onde a utilidade de um modelo de carga de- 
pende de quae bem e modelo sintetico representa e efeito 
observado em cargas reais e, se ele tem poder preditivo. 
Cargas sao vahdas na medida em que permitem avaliar 
cerretamente e comportamento de sistema no que diz res- 
peito as caracteristicas de interesse. Segundo Smith [17], 
na medida em que e desempenho e sensivel a mudan9as 
na carga de trabalho, para outros cenarios de carga as esti- 
mativas de desempenho serao pence confiaveis ou entao o 
modelo ou metedelogia de estimativa serao considerados 
suspeitos. Ou seja, os resultados de desempenho obtidos 
para uma determinada carga de trabalho sao vahdos para 
o contexto daquela carga. 

Choi e Yeo prepuseram uma tecnica para derivar atra- 
sos unidirecionais avaliando os tempos entre pacotes de 
dados e suas confirma96es (ACKs) em conexoes TCP. 
Essa tecnica foi analisada pelos autores atraves de simu- 
la96es, porem, nao chegaram a aplica-la na analise de as- 
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simetria ou em um estudo abrangente na Internet [4]. 

Por exigir a medi9ao nos dois extremes da comunica- 
9ao e demandar mecanismos de sincronizagao de relogios 
nesses extremes, estudos sistematicos sobre RTT (round- 
trip time) na Internet no passado foram limitados pela difi- 
culdade de obter acesso a um niimero significativo de ma- 
quinas instaladas em pontes diversos da rede. Por exem- 
plo, Bolot [2] realizou medi9oes apenas entre um par de 
maquinas na rede, as quais o autor tinha acesso. Naquele 
trabalho, o autor realizou medi96es por intervalos curtos 
(ate 800 medifoes consecutivas), variando o intervalo en- 
tre medi9oes de 8 ms a 500 ms. 

Trabalhos de medi9ao de caracteristicas da rede so se 
tomaram reahnente viaveis recentemente, com o advento 
do PlanetLab '.O All-Pairs Ping^ (APP) foi um projeto 
que mediu RTTs no PlanetLab a cada 15 minutos por 2 
anos [19, 22]. Nesse caso o comando ping foi utilizado, o 
que nao permite o casamento preciso entre as informa96es 
nas duas extremidades do canal de comunica9ao. Ja o 
servi90 CoMon realiza a monitora9ao do RTT, alem de 
diversas metricas de carga, mas nao armazena a rela9ao 
entre os pares de nos utilizados e se limita a um intervalo 
de 5 minutos [9]. Numa analise do progresso evolutivo do 
RTT medio do PlanetLab [20], Tang e outros observaram 
uma consideravel varia9ao no RTT entre duas medi96es 
para os mesmos pares de maquinas, ao realizar medi9oes 
apenas a cada 15 minutos. 

Ainda no PlanetLab, Pucha e outros utilizaram paco- 
tes formados como segmentos de contirma9ao do proto- 
colo TCP (ACKs) enviados para portos altos de maquinas 
distantes como forma de medir RTTs. Pela defini9ao do 
protocolo TCP, as maquinas contactadas enviavam seg- 
mentos de erro (RSTs) de volta para a maquina de origem, 
o que llies permitia medir os tempos de ida-e-volta [12]. 

Em uma analise mais recente da assimetria dos atra- 
sos na Internet, Pathak e outros reaUzaram um estudo 
abrangente no qual mediram a severidade da assimetria 
no atraso entre diversos pares de nos do PlanetLab [10]. 
Seus resultados estao de acordo com os de Tang e outros, 
sendo observado que a assimetria dos atrasos prevalece na 
grande maioria dos nos, podendo ser em parte atribuida a 
assimetria nas rotas e em parte a congestionamentos tran- 
sientes. 

Um resumo comparativo dos principais trabalhos de 
analise dos tempos de ida-e-volta em cenarios da Internet 
e no PlanetLab e apresentado na Tabela 1 . 

O uso do PlanetLab para experimentos sobre a Inter- 
net e abordado por Pathak e outros [10] e por Pucha e 
outros [12]. Ambos observaram uma diferen9a de conec- 
tividade entre nos da Internet academica e da Internet co- 
mercial. Levamos esse aspecto em considera9ao ao in- 
cluir nos locaUzados em redes comerciais em nossas me- 

^http : / /www .planet-lab. org/ 

^http : / /pdos . csail . mit . edu/~strib/pl_app/ 



di96es. Neste trabalho, entretanto, realizamos uma ana- 
lise de agrupamentos baseada nos valores medidos, nao 
em uma classfica9ao a priori dos nos. 

Para medir atrasos unidirecionais, utilizamos uma tec- 
nica derivada de Pathak e outros [10] que se baseia no uso 
do protocolo NTP ^ para sincroniza9ao dos relogios das 
maquinas e avalia9ao dos erros maximos envolvidos. Ro- 
cha e outros discutem as limita9oes dessa tecnica [15], es- 
pecialmente os problemas de atualiza9ao de relogio, que 
foram consideradas ao se excluir nos problematicos, con- 
forme sera discutido posteriormente. 

Como pode ser observado na tabela 1, talvez por res- 
tri95es da capacidade de coleta e processamento dos da- 
dos, a maior parte dos projetos desenvolvidos para medir 
atrasos na Intemet foram baseados em periodos longos 
entre amostragens, da ordem de minutos, ou realizaram 
medi9oes por intervalos curtos de tempo. Entretanto, al- 
guns desses trabalhos indicam que as amostras muito es- 
pa9adas perdem detalhes da varia9ao dos atrasos em inter- 
valos de tempo menores [20], enquanto medi95es muito 
proximas (da ordem do valor do RTT) podem sofrer de 
interferencias umas das outras [2]. Neste trabalho, op- 
tamos por adotar uma resolu9ao temporal intermediaria 
(umamedi9ao a cada 10 segundos) para evitar os dois pro- 
blemas mencionados. Alem disso, utiUzamos uma infra- 
estrutura de coleta contmua para permitir que cada no me- 
didor pudesse operar por um periodo de tempo mais longo 
(10 dias). 



3. IVlETOLOGIA DE COLETA 

O RTT {round-trip time) entre dois nos A e B e de- 
finido como sendo a soma do atraso direto de A para 
B e do atraso inverso de B para A. Ele tem sido utiU- 
zado largamente como metrica em diversas aplica96es de 
rede que necessitam inferir atrasos e/ou locahza9ao dos 
nos. O RTT e comumente utilizado para derivar os atra- 
sos em cada sentido, onde normalmente assume-se seu 
valor como sendo RTT/2. Entretanto, a existencia de as- 
simetrias nesses atrasos individuals prejudica a precisao e 
desempenho das aplica96es que se utilizam desse pressu- 
posto [10]. Portanto, se possivel, autiliza9ao dos atrasos 
individuals em cada sentido do enlace e desejavel por tra- 
zer consigo maior exatidao. 

3.1. MEDigAO DOS TEMPOS DE IDA-E-VOLTA 

Para a realiza9ao da coleta dos atrasos de rede utih- 
zamos uma ferramenta com um protocolo proprio, visto 
que o ping (ICMP echo request) nao nos proveria as in- 
forma96es necessarias para inferir os atrasos individuals 
de cada sentido da comunica9ao. Optamos por utilizar 
uma abordagem ''Three-Way Ping", inspirada no three- 

^http : //www . ietf . org/rf c/rf cl305 . txt 
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Tabela 1. Sumario comparativo das pesquisas sobre atrasos na Internet 



Trabalho 


Metodo 


Espa^amento 1 Duraqdo 


Variagdo Atraso 


Assimetria 


Modelo Sintetico 


Escala 


Bolot [2] 


NelDyn 


8-500 ms / SOO mecligoes 


\/ 






2 nos 


Choi e Yoo [4] 


TCP ACKs 


-^1 ms / 100 s 








2 nos 


Pucha e outros [12] 


TCP ACK/RST 










180 nos 


Yoshikawa [22] 


ping 


15 min. / 2 anos 


\/ 






600 nos 


Park e Pai [9] 


ping 


5 min. / - 










Tang e outros [20] 


ping 


15 min. / 2 anos 


\/ 






600 nos 


Pathak e outros [10] 


OwPing 


20 min. / 10 dias 








94 nos 


Estc trabalho 


3'Way ping 


10 seg. / 10 dias 








81 nos 



way handshake utilizado no estabelecimento de conexoes 
TCP, de maneira a ter acesso ao RTT nos dois sentidos em 
momentos proximos. 

O Three-Way Ping (TWP) funciona da seguinte ma- 
neira: o no A envia periodicamente solicitagoes ao no B, 
utilizando mensagens UDP. A solicitagao inicial e deno- 
minada PING, ao passo que o no B respondera um PING- 
ACK. Ao receber a resposta do no B, o no A devolve 
um ACK para completar a rodada de troca de mensa- 
gens deste protocolo. Assim, o TWP possibilita que, em 
um no A qualquer, calculemos o RTT de A para B como 
sendo o intervalo de tempo entxe a emissao um PING e o 
recebimento da resposta PING-ACK. Para um momento 
proximo, e tambem possi'vel calcular em B o RTT de B 
para A como sendo o intervalo entre a emissao de um 
PING-ACK e o recebimento do ACK, conforme ilustra a 
figura 1. 



I _RTJ B->A _| 




Figura 1 . Sequencia de troca de mensagens no TWP 

Implementamos o TWP em Java, como um software 
para coleta dos atrasos de rede no PlanetLab. Cada men- 
sagem do protocolo consiste em um datagrama UDP com 
a especifica9ao do tipo de mensagem (PING, PING-ACK 
ou ACK) e um niimero de sequencia, para ordenagao e 
identificagao linica de cada sequencia de tres mensagens. 
Para os identificadores, que cobriram todo o espago de 
endere9amento a eles dedicado algumas vezes durante o 
experimento, foi utilizado um mecanismo identico ao uti- 
lizado pelo protocolo TCP no processamento de seus nii- 
meros de sequencia. No ato de envio e recebimento das 
mensagens, cada no armazena em seu log, em binario, 
a qumtupla: (timestamp, niimero de sequencia, tipo de 



mensagem, ID do no origem, ID do no destino). 

Dessa forma, cada evento de envio ou recebimento 
ocupa apenas 15 bytes no log. Os IDs dos nos origem 
e destino nao consistem em seus endere90s de rede, mas 
em um identificador provido pela sua respectiva ordem 
em uma tabela hash contendo todos os nos e seus respec- 
tivos portos. Assim, apos a tabela hash ser preenchida 
com todos OS nos do experimento, obtem-se uma lista- 
gem do conjunto de chaves, onde o ID de cada no sera 
a posi9ao dele naquele conjunto. Com isso foi possivel 
economizar espa90 no armazenamento do log e, ainda, a 
utiliza9ao dos IDs incrementais facilitou o processamento 
posterior. 

Para reduzir a quantidade de mensagens trocadas e 
evitar redundancia, cada no inicia TWPs para metade do 
conjunto restante de nos e responde as solicita96es da ou- 
tra metade do conjunto. Para tal utilizamos um iterador 
circular sobre o conjunto de chaves da tabela hash. As- 
sim, a cada intervalo de comunica9ao um no A somente 
enviara ou recebera requisi9oes TWP para/de um outro no 
B. Isso e possivel pois a sequencia das chaves e a mesma 
em todos os nos. 

3.2. O PROCESSO DE COLETA 

A opera9ao de todo o sistema e controlada por um no 
coordenador, que centraliza a identifica9ao de todos os 
nos no inicio da coleta e redistribui as informa96es de ini- 
cializa9ao para todos os nos participantes, determinando 
como cada no devera atuar durante o experimento. Os nos 
participantes armazenam o log localmente com um meca- 
nismo de rota9ao periodica. Os arquivos que ja foram 
rotacionados sao comprimidos e enviados para o servidor 
por uma tarefa de fundo {background), controlada por um 
sistema de escalonamento de transmissoes para evitar que 
OS nos sobrecarreguem o coordenador com acessos simul- 
taneos. Ao final do experimento, o coordenador envia um 
comando para os nos participantes finalizarem a troca de 
mensagens e enviarem a ele os resultados restantes. 

Numa analise do progresso evolutivo do PlanetLab, 
Tang e outros [20] observaram que na maior parte do 
tempo, mais de 80% dos nos estavam online, sendo que 
certos conjuntos de nos apresentavam uma confiabilidade 
maior que os demais. Tipicamente o uptime dos nos do 
PlanetLab e em media 5 dias [23]. A coleta foi realizada 
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por 10 dias em 2009, do dia 27 de maio ao dia 05 de ju- 
nho. Nesse periodo, 14 nos foram reiniciados pelo menos 
uma vez. Quando um no era reiniciado ele comunicava-se 
com o coordenador para obter a lista dos demais nos par- 
ticipantes e voltava a trocar requisigoes TWP com eles. 
Entretanto, durante a reinicializa9ao desses 14 nos houve 
o problema de nova sincronizagao de relogios pelo NTP 
e de identificadores pelos programas de monitora9ao, que 
comprometeram a iiiterpreta9ao dos logs. Outros 5 nos 
apresentaram problemas de contato ao servidor NTP as- 
sociado. 

A premissa da sincroniza9ao de relogios nao seria im- 
portante para uma analise local dos tempos em uma ma- 
quina, mas e essencial para podermos correlacionar as 
medi96es de diversas maquinas ao longo do tempo para 
as analises com base temporal. Por esse motivo, optamos 
por descartar os 19 nos que tiveram algum problema de 
sincroniza9ao durante o periodo. Assim, os logs utiliza- 
dos neste trabalho ser referem aos 81 nos restantes. 

Nos 81 logs analisados, ignoramos as tres primeiras 
e as tres ultimas boras do experimento para evitar va- 
lores discrepantes nas perdas e atrasos, devidos ao ini- 
cio e encerramento dos diversos programas envolvidos 
e a sobrecarga do coordenador com as transferencias fi- 
nals. Acerca da intrusividade da ferramenta, a monito- 
ra9ao gerou um volume de trafego de cerca de 2,2 Kbps 
por maquina (com 10 segundos entre TWPs). Tal volume 
e pouco significative para a rede do PlanetLab, onde os 
enlaces de ultima milha nunca sao inferiores a 1 Mbps. 
Quanto a carga de processamento gerada nos nos, essa foi 
sempre inferior a 1% (CPU utilization). 



4. Analise dos dados coletados 

O tamanho medio dos logs coUiidos foi de 85.000 
TWP/no, o que leva a cerca de 255.000 mensagens tro- 
cadas entre cada par de nos. Com 81 nos sendo conside- 
rados na analise final temos um total de 3.240 enlaces bi- 
direcionais e, consequentemente, pouco mais de 826 mi- 
lh5es de mensagens trocadas durante os 10 dias da coleta. 
Ao todo, OS 81 logs binaries ocuparam 20 GiB de espa90 
em disco (4 GiB, com compressao 7Zip). O log com- 
plete, bem come os programas de medi9ao e coleta dos 
TWP podem ser obtidos contactando-se o primeiro autor. 

Conforme discutido na se9ao 3.1 e ilustrado na fig. 1, 
para dois nos A e B, os tempos de ida-e-volta entre 
eles sao definidos como o tempo decorrido entre o en- 
vio e a recepgao de duas das mensagens do three-way 
ping (PING/PING-ACK ou PING-ACK/ACK, conforme 
o caso). 

Caso ambos os nos A e B estejam com seus relogios 
sincronizados, e possivel tambem calcular os atrasos in- 
dividuals se estes forem de ordem de grandeza superior 



ao escorregamento dos relogios {clock-drift) . Os relo- 
gios dos nos do PlanetLab apresentam valores reduzidos 
de drift em rela9ao a seus servidores NTP: 60% apresen- 
tam um erro de menos de 2 ms e 40% apresentam um 
erro maximo estimado pelo NTP de menos de 10 ms [10]. 
Com base nessa premissa, o atraso direto de A para B e 
calculado subtraindo-se o tempo de chegada da solicita- 
9ao PING em B do seu tempo de envio em A. O atraso in- 
verse tambem podera ser calculado ao subtrair-se o tempo 
de chegada da resposta PING-ACK em A do seu tempo 
de envio em B. Ademais, uma estimativa da precisao do 
atraso direto pode ser realizada se for considerado tam- 
bem o atraso direto disponibilizado pelos tempos de en- 
vio e chegada da confirma9ao final ACK. Estes atrasos 
individuals serao utilizados na anaUse de assimetria na se- 
9ao 4.4. 

Consideramos como mensagens perdidas aquelas que 
aparecem no log da maquina origem mas que nao sao re- 
gistradas na maquina de destine (identificades pelo nu- 
mero de sequencia de cada mensagem). Nesses casos, o 
RTT em pelo menos um dos sentidos nao pode ser calcu- 
lado. 

4.1. EVOLUgAO DIARIA 

Como mencionado anteriormente, a coleta foi reah- 
zada dos dias 27/05/2009 a 05/06/2009, incluindo por- 
tanto um final de semana (quarto e quinto dias da coleta). 
A figura 2 apresenta as medias diarias para algumas gran- 
dezas obtidas a partir do log. Nos quatro casos, as bar- 
ras verticals indicam os intervales com 99% de confian9a 
para a grandeza calculada. 

A figura 2(a) exibe a evolu9ao diaria do RTT medio 
ao longo do log. Nela e possivel observar que do segundo 
ao sexto dia houve um periodo de queda no RTT medio, 
que foi de 183 ms a 169 ms, incluindo um fim de semana. 
Apos este periodo observa-se uma breve subida do setimo 
ao oitavo dia para o valor de 177 ms e uma nova queda 
ate o fim da coleta no decimo dia, alcan9ando entao o 
menor valor para o RTT medio: 168 ms. Ja a mediana, 
exibida na figura 2(c), manteve-se Ugeiramente inferior 
a media, indicando uma concentra9ao maior em valores 
mais baixos. 

A variabilidade das medi9oes e ilustrada na fi- 
gura 2(b), que exibe a evolu9ao diaria da variabilidade 
media dos atrasos ao longo do log. Nela e possivel obser- 
var que, tal como observado no RTT medio, do segundo 
ao oitavo dia houve um periodo de queda na variabilidade, 
seguido de uma subida do oitavo ao nono dia. Ou seja, ao 
mesmo tempo que o RTT medio decaiu, observou-se uma 
maior homogeneidade no coeficiente de varia9ao dos atra- 
sos do referido periodo. 

''O termo escorregamento e adotado pela RNP como a tradujao mais 
indicada para drift nesse caso — vide 
http : //ntp .br/NTP/MenuNTPVocabulario 
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1° 2° 3° 4° 5° 6° T 8° 9° 10° 
dia do experimento 

(a) RTT m6dio 




1° 2° 3° 4° 5° 6° 7° 8° 9° 10° 
dia do experimento 

(b) Variaf ao do RTT (CV) 




2° 3° 4° 5° 6° 7° 8° 9° 10° 
dia do experimento 

(c) RTT mediano 




go 40 go go 70 go go ^ qO 

dia do experimento 
(d) Perdas 



Figura 2. Evolufao diSria das medi56es 



Finalmente, a figura 2(d) exibe a evolu9ao diaria da 
perda media de mensagens ao longo do log. Observamos 
que a perda de mensagens apresentou uma maior varia- 
bilidade nos 3 primeiros dias da coleta, passando a de- 
mostrar valores mais homogeneos a partir do quarto dia. 
O terceiro dia apresentou o maior valor global de 0,86% 
para a perda media de mensagens e o nono dia apresentou 
o menor valor global de 0,18%. 

E interessante observar que as madias diarias, calcu- 
ladas considerando todos os 81 pares, apresentam quedas 
durante o final de semana para todas as grandezas ilustra- 
das na figura 2. Se aceitarmos que o trafego na Internet 
pode ser mais reduzido durante os finals de semana, a va- 
riagao observada pode ser atribuida a redu9ao das filas 
nos roteadores naquele periodo (e, consequentemente, a 
redugao da fragao da latencia associada). 

4.2. DlSTRIBUigAO ACUMULADA DOS RTTS 

Uma outra forma de interpretar os dados e determi- 
nando come os tempos de ida-e-volta e as perdas se com- 
portam para cada par de maquinas participantes. Para 
isso, calculamos as metricas de interesse separadamente 
para cada par e apresentamos aqui as distribuigoes acu- 
muladas obtidas. 

Para o RTT, foi obtida uma media global de 181 ms. 
Conforme pode ser observado na figura 3(a), apenas 40% 
dos pares apresentaram medias acima de 181 ms, com um 



maximo de 537 ms para o RTT medio. Se observarmos os 
resultados para o 99-quantil na figura 3(b), veremos que 
em 90% dos pares de maquinas considerados, apenas um 
por cento dos RTTs medidos ficou acima de 500 ms. 

O coeficiente de varia9ao (CV) e apresentado na fi- 
gura 3(c) e indica a variabilidade dos dados. E calculado 
pelo desvio padrao dividido pela media, de maneira que 
quanto menor o CV, mais homogeneo e o conjunto de da- 
dos. Foram observadas altas variabilidades nos atrasos 
das mensagens para a maioria dos pares. Uma fra^ao pe- 
quena dos pares (menos de 5%) apresentaram CVs abaixo 
de 0,05; 50% ficaram abaixo de 0,56, e 50% ficaram entre 
0,22 e 1,74. 

Na figura 3(d) podemos observar que, em geral, a taxa 
de perda de mensagens foi baixa. A taxa de perda media 
foi de 0,41% apenas, cerca de 60% dos pares de maquinas 
experimentaram perdas inferiores a 0,1% e 90% dos nos 
apresentaram perdas abaixo de 0,90%, com um maximo 
de 8,6% de perda de mensagens. 

Quanto aos valores extremes (maximos e mmimos) do 
RTT, cujos graficos nao foram incluidos por questSes de 
espafo, observamos que a media dos RTTs mmimos foi 
de 145 ms, com 75% dos nos abaixo de 198 ms e 95% 
abaixo de 330 ms. O mmimo absolute foi de 1 ms (entre 
nos de uma mesma rede) e o maior valor observado para 
o RTT mmimo foi de 409 ms. Ja a media dos RTTs maxi- 
mos foi de 27 segundos, com 75% dos nos abaixo de 32 
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segundos e 95% abaixo de 112 segundos. O maximo ab- 
solute foi de 170 segundos, ou seja, 2,8 minutos de atraso. 
Esses casos de valores muito altos nao se encontravam em 
rajadas, mas, como mensagens que aparentemente se se- 
pararam do fluxo usual e acabaram chegando ao destino 
muito mais tarde que aquelas enviadas imediatamente an- 
tes e depois delas. 

4.3. CARACTERIZAgAO DA DlSTRIBUigAO DOS 

Atrasos 

Um dos objetivos deste trabalho e identificar a me- 
Ihor distribui9ao estatistica que modelasse os atrasos me- 
didos. Tal distribuifao poderia ser utilizada em trabalhos 
que necessitem gerar valores sinteticos de RTT que acom- 
panhem uma distribui9ao realista. Para determinar a dis- 
tribuifao utilizamos o software Minitab^. Devido a suas 
limita96es em termos da quantidade maxima de linhas 
permitidas e do tempo necessario para o processamento, 
dos 551 miUiSes de medidas de RTT coletados obtivemos 
uma amostra aleatoria de 0,1%, ou 551 mil medidas. 

A distribuifao estatistica dos dados pode ser encon- 
trada atraves de testes padrSes para determinar o grau de 
adequa9ao (goodness of fit): Chi-square, Kolmogorov- 
Smirnov (KS) e Anderson-Darling (AD) [18], dos quais o 
Minitab utiliza esse ultimo. 



^http : / / www .minitab . com/ 



Ha uma grande quantidade de distribui9oes estatisti- 
cas que consistiriam em candidatos a modelo de distribui- 
9ao dos dados, das quais a tabela 2 lista as distribui95es 
que se mostraram mais apropriadas. Na segunda coluna, o 
coeficiente AD fornece-nos imia medida da qualidade do 
ajuste. Ao compararmos o ajuste das distribui96es para 
o conjunto de dados, a distribui9ao com o menor valor de 
Anderson-Darling oferecera o melhor ajuste (best fit). Po- 
rem e necessdrio que ela rejeite a hipotese nula de que os 
dados tem distribui9ao normal, de maneira que o p-value 
deve ser menor ou igual a 0,05. 



Distribuigao 


AD 


P-Value 


3 -Par Lognormal 


203 


* 


Gamma 


208 


< 0,005 


3-Par Loglogistic 


214 


* 


Lognormal 


267 


< 0,005 


3-Par WeibuU 


273 


< 0,005 


Weibull 


472 


< 0,010 


Normal 


986 


< 0,005 


2-Par Exponential 


2376 


< 0,010 



Tabela 2. Qualidade do ajuste da distribuifao dos atrasos 

A figura 4 exibe os graficos de probabiUdade de ajuste 
daquelas distribui9oes, consistindo numa tecnica para 
avaliar se o conjunto de dados segue ou nao uma dada dis- 



7 



E. Valadao, D. Guedes, R. Duarte 



Caracter. de tempos de ida-e-volta na Internet 



Probability Plot for RTT (ms) 
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Goodness oF FH Test 

3-Parameter Lognormal 
AD = 202,669 
P-Value = * 

Gamma 

AD = 207,611 

P-Value < 0,005 

^-Parameter Loglogistic 
AD = 214,431 
P-Value = * 

3-Parameter Weibull 
AD = 272,806 
P-Value < 0,005 



Figura 4. Grafico de probabilidades das distribuifoes 



tribuigao. Os dados sao plotados sobre a distribuigao can- 
didata de maneira que os pontos devam formar aproxima- 
damente uma linha reta e desvios na reta indicam desvios 
da distribuifao especificada [5]. Sendo assim, nosso cri- 
terio para a distribui9ao com melhor ajuste e aquela com 
o grafico de probabilidade mais linear. O coeficiente de 
correla9ao AD prove uma medida da linearidade do gra- 
fico, assim como uma medida do quao bem a distribuifao 
ajusta-se aos dados. 

Ao observar a tabela 2 e a figura 4 verificamos que 
as distribuifSes Lognormal de 3 parametros e Gamma fo- 
ram as que melhor se ajustaram aos atrasos observados. 
Porem, com a Lognormal de 3 parametros nao foi possi- 
vel rejeitar a hipotese de normalidade. Alem disso, das 
duas, a distribuigao Gamma foi a que melhor se ajustou 
aos extremos (atrasos <100 ms e >500 ms). Portanto, 
propomos a utilizafao da distribuifao Gamma como um 
modelo de distribui^ao apropriado para a modelagem de 
atrasos na rede, provendo um balanjo entre melhor ajuste 
e simplicidade. 

A distribuigao Ganmia e uma distribuifao de probabi- 
lidade contmua que possui dois parametros: um parame- 
tro de escala Q e um parametro de forma A. Ela e fre- 
quentemente utiUzada para modelar tempos de espera e 
aparece naturalmente em processes para os quais os tem- 
pos de espera entre eventos com distribui9ao Poisson sao 



relevantes. Ela pertence a famflia das distribuifSes ex- 
ponenciais com parametros naturals A-le-l/Q. A sua 
fungao caracteristica <px(t) e (1 — <dit)~^, em que t e o 
argumento da fiingao caracteristica e i e a raiz quadrada 
de menos um. 

A tabela 3 exibe as estimativas dos parametros das dis- 
tribui9oes para modelagem do atraso de mensagens. Atra- 
ves dela e possivel configurar as distribuigSes para exibi- 
rem atrasos de rede compativeis com o PlanetLab. Se- 
gundo Silva e outros, a geragao de cargas sinteticas mais 
realistas tambem possibilitaria analisar com mais precisao 
aplicagoes em contextos semelhantes ao do log coletado, 
de maneira a facilitar o projeto, implementagao e valida- 
qao de novos protocolos de rede [16]. Desta maneira, este 
trabalho fornece tanto uma carga real quanto as distribui- 
9oes estatisticas mais apropriadas para a modelagem dos 
atrasos de rede atraves de uma carga sintetica. 

A figura 5 exibe as estatisticas descritivas da distri- 

buigao Gamma configurada com os parametros de me- 
lhor ajuste ao RTT do PlanetLab. Sua obliquidade po- 
sitiva {skewness=Q,921) faz com que sua massa seja con- 
centrada a esquerda e exiba uma cauda mais longa a di- 
reita, demonstrando uma assimetria na dispersao dos da- 
dos em relagao a curva normal (curva sobre o histograma). 
A curtose tambem positiva (kurtosis=l, 294) caracteriza 
um menor achatamento da curva em relagao a normal. 
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Tabela 3. Estimativas dos parametros da distribuigao dos atrasos 



Distribuigdo 


Localizagdo ^ 


Forma A 


Escala 9 


Limiar 


Gamma 




4,63062 


43,16537 




3 -Par Lognormal 


5,34111 




0,41280 


-27,12915 


3 -Parameter Loglogistic 


5,25100 




0,26255 


-9,23031 


3 -Parameter Weibull 




1,51208 


158,33886 


56,63291 



ou seja, exibe um afunilamento com um pico mais alto 
e uma maior concentra9ao que a normal. Consequente- 
mente, a distribui9ao Gamma assim configurada possui 
caudas mais prolongadas, onde e relativamente facil ob- 
ter valores que se afastam da media a varios multiplos do 
desvio padrao. Observe ainda que a media exibida e de 
199 ms, ou seja, ligeiramente diferente da media global 
exibida pelo PlanetLab de 181 ms (isto e devido a imper- 
feifoes no ajuste da modelagem). 

4.4. Assimetria dos Atrasos 

Em uma analise do progresso evolutivo do RTT 
{round-trip time) medio do PlanetLab, Tang e outros ob- 
servaram uma consideravel variagao no RTT entre pares 
de nos (de 150 a 550 ms), mesmo entre curtos periodos de 
tempo (15 minutos) [20]. Isso apresenta um desafio sig- 
nificativo aos modelos topologicos que pressupoem uma 
latencia fim-a-fim estatica entre pares de nos. Em recente 
analise da assimetria dos atrasos na Internet [10], Pathak e 
outros realizaram um estudo abrangente no qual mediram 
a severidade da assimetria no atraso entre diversos pares 
de nos do PlanetLab. Seus resultados estao de acordo com 
OS de Tang e outros, sendo observado que a assimetria 
dos atrasos prevalece na grande maioria dos nos, podendo 
ser em parte atribuida a assimetria nas rotas e em parte a 
congestionamentos transientes. Observaram tambem que 
a assimetria e dinamica, ou seja, a medida que o tempo 
progride, a assimetria dos atrasos varia. Alem disso, no- 
taram que redes comerciais exibem niveis mais altos de 
assimetria que redes educacionais e de pesquisa. 

Visto que a assimetria dos atrasos na Internet e uma 
realidade, conduzimos uma analise da assimetria do log 
coletado. Utilizamos a metrica assimetria relativa, que 
consiste no modulo da diferenga entre os atrasos direto 
e inverso normalizado pelo atraso mmimo, conforme re- 
presentado na equagao 1 . Naquela equagao, quanto mais 
proximo de zero for o resultado, mais simetrico sera e 
consequentemente, quanto maior for o valor encontrado, 
maior sera a assimetria. 



assimetria ■ 



\atrasoAB — atraso ba\ 
min{atrasoAB, atrasos a) 



(1) 



atraso direto de 60 ms. Portanto, o atraso inverso foi 

de 90 ms o que representa uma assimetria de 30 ms en- 
tre esses dois atrasos. Com 60 ms de atraso direto e 
90 ms de atraso inverso, temos uma assimetria relativa 
de abs(60-90)/60=0,50. Isso significa que o sentido com 
maior atraso apresentou um acrescimo de 50% em relagao 
ao valor do atraso no outro sentido. 

Os resultados obtidos para esta metrica estao expres- 
sos na tabela 4 e na figura 6, onde podemos observar que 
a assimetria media do PlanetLab e alta (0,947), porem 
com uma alta variabilidade (9,27). Mesmo a media calcu- 
lada com a exclusao de 5% dos valores discrepantes ainda 
pode ser considerada alta, com um valor de 0,409. Metade 
dos nos apresentou uma assimetria relativa entre 0,08 e 
0,56 e 95% deles apresentaram uma assimetria abaixo de 
3,08. 



V 
X 
CL 




Por exemplo, considere que em determinado momento 
o RTT observado num par de nos foi de 150 ms e o 



0.01 0.1 1 10 100 1000 



Figura 6. Distribuifao acumulada da assimetria relativa dos atrasos 



4.5. Clusteriza^ao DOS Enlaces 

Realizamos tambem uma clusterizagao dos enlaces de 

acordo com suas estatisticas descritivas (atraso medio, 
seus quantis, variabilidade do atraso e % de perda), bus- 
cando separa-los em grupos que, para estas metricas, pos- 
suam um comportamento aproximado. Os canais entre 
duas maquinas A e B foram considerados separadamente 
em cada sentido, isto e, as medidas de RTT de A para B 
foram consideradas como um canal de medigao e as me- 
didas de B para A como outro canal independente. 

Para a clusterizagao utilizamos o software Weka^cora 
o algoritmo de clusterizagao Expectation-Maximization 
(EM), donde chegamos as 5 instancias de clusters listadas 



http : //www . cs . waikato . ac . nz/ml/weka/ 
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Distribuigao Gamma(4,63062j43,16537) 




130 260 390 E20 



650 780 



95% ConFidence Intervals 



Median 




Anderson-Darling Normality Test 


A-Squared 


962,93 


P-Value < 


0,005 


Mean 


199,57 


StDev 


92,83 


Variance 


8618,11 


Skewness 


0,92773 


Kurtosis 


1,29374 


N 


100000 


Minimum 


6,54 


1st Quartile 


131,90 


Median 


185,14 


3rd Quartile 


252,24 


Maximum 


927,31 


95% Confidence Interval for Mean 


199,00 


200,15 


95% Confidence Int 


erval fior Median 


184,45 


185,79 


95% Confidence Interval For StDev 


92,43 


93,24 



185,0 187,5 190,0 192,5 195,0 197,5 200,0 



Figura 5. Distribuijao Gamma para o RTT do PlanetLab 



Tabela 4. Estatfsticas da assimetria relativa dos atrasos 



Media 


Desvio Padrao 


CV 


Q25 


Mediana 


Q75 


Q90 


Q95 


Q99 


0,947 


8,78 


9,27 


0,08 


0,20 


0,56 


1,62 


3,08 


12,07 



Tabela 5. Estatisticas da clusterizagao 



Cluster 


Enlaces 


RTT 


Taxa de 


Cluster 


(%) 


Media 


CV 


Perda (%) 


cl 


21% 


49 ms 


1,12 


0,22% 


c2 


21% 


131 ms 


6,37 


0,40% 


c3 


24% 


167 ms 


0,33 


0,30% 


c4 


21% 


269 ms 


0,96 


0,12% 


c5 


13% 


358 ms 


0,44 


1,40% 


Global 


100% 


181 ms 


1,89 


0,41% 



na tabela 5. Observamos que o cluster 1 apresentou um 
baixo RTT medio e baixa perda de mensagens, ao con- 
trario do cluster 5, que apresentou atrasos relativamente 
bem maiores e uma maior taxa de perda de mensagens. 
O cluster 2 mostrou uma grande variabilidade nos dados, 
dado seu alto CV, ao passo que o cluster 3 teve a menor 
variabilidade. Acerca do cluster 4, podemos dizer que ele 
apresentou um comportamento proximo da media global 
do PlanetLab. 

A fim de exibir o comportamento tipico dos RTTs me- 
didos per um no, selecionamos aleatoriamente uma cone- 
xao de cada cluster e geramos a serie temporal dos RTTs 



medidos para aquela conexao. A figura 7 traz os resulta- 
dos deste procedimento. 

Pela figura 7, nos exemplos pode-se observar algumas 
das caracteristicas que identificam cada cluster: em (a) os 
valores baixos da maioria das medidas de RTT para o par 
do cluster 1, porem com muitos picos elevados (alta vari- 
abilidade); em (b) a variabilidade ainda mais elevada do 
par do cluster 2, ainda com um limite inferior baixo; em 
(c) o menor numero de variafSes nas medidas do cluster 
3, porem ja com um limite inferior mais alto e, por fim, 
em (d), para o cluster 4, um valor medio ainda mais alto 
com significativas variafSes. Um exemplo de serie tem- 
poral para o cluster 5 nao foi incluido por limita^oes de 
espa90, mas tambem apresenta padrao visualmente dife- 
rente dos demais. 

Para ilustrar mais claramente as diferen9as entre os 
grupos exibimos abaixo as distribuigSes acumuladas, ja 
apresentadas para o log completo mas agora com uma 
curva para cada um dos clusters encontrados. 

Na figura 8, notamos que as curvas de RTT medio 
(fig. 8(a)) sao as que meUior separam os clusters. Nas de- 
mais, alguns clusters apresentam distribuifSes semelhan- 
tes, mas ainda assim e possivel observar as separagoes. As 
distribuifoes de perdas, apesar de parecerem proximas, se 
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Figura 7. RTTs ao longo do tempo para os diferentes clusters 



diferenciam mais claramente nas duas extremidades, pela 
quantidade de nos que experimentam poucas perdas em 
cada cluster e pelos valores maximos de perdas em cada 
caso. 

Quanto a topologia, analisamos a composigao da dis- 
tribui9ao geografica dos clusters. Observamos que o clus- 
ter 1 e populado principalmente por nos de um mesmo 
continente, seja ele Europa ou America do Norte, en- 
quanto que o cluster 2 e caracterizado por nos do Oriente 
Medio ou Mediterraneo. Ja o cluster 3 e constituido na 
maior parte por pares de nos dos continentes Europa com 
America do Norte. O cluster 4 e composto essencialmente 
por pares de nos da America do Sul com outro continente 
e o cluster 5 por pares de nos da Asia com outro conti- 
nente. 

Finalmente, como os enlaces em cada cluster possuem 
caracterfsticas proximas, seria de se esperar que as medi- 
das dos canals de A para B e de B para A fossem classi- 
ficados no mesmo cluster. Como as medidas sao obtidas 
pelo Three-Way Ping, normalmente, um par de medidas 
(uma em cada sentido) e obtido de cada vez. 

Usualmente, as duas medifoes de RTT em um TWP 
tendem a ser semelhantes, dado que cada uma envolve 
uma mensagem em cada sentido. Entretanto, oscilagoes 
rapidas da rede podem ocorrer durante a primeira ou a 
terceira mensagens, levando a valores de RTTs ligeira- 
mente diferentes, ou a terceira mensagem pode se perder, 



o que afetaria apenas a segunda medi9ao de RTT. Tais va- 
riagoes, quando frequentes, podem levar a casos onde as 
medidas de A para B sejam classificadas em um cluster 
diferente das de B para A. 



Tabela 6. Distribuigao dos canais entre cada par de miquinas A,B. 
A liltima linha indica a porcentagem dos casos da diagonal principal 
em rela5ao ao total em cada cluster. 



cluster 


cluster de B— >^A 


de A-)>B 


cl 


c2 


c3 


c4 


c5 


CI 


1876 


290 


14 


3 





C2 




1078 


205 


24 


7 


C3 






2084 


112 


5 


C4 








1464 


140 


C5 










1332 




A^B e cj A B- 


-^A e cj 






86% 


67% 


86% 


84% 


90% 



A tabela 6 mostra, para todos os pares A,B, quantos 
foram classificados no mesmo cluster (diagonal) e quan- 
tos pares foram divididos entre dois clusters diferentes. 
Por exemplo, existem 205 pares em que o canal em um 
sentido foi classificado em C2 enquanto o canal no sen- 
tido contrario foi classificado em C3. Apenas Cl e C5 
nao tem nenhum par compartilhado dessa forma, o que se 
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Figura 8. AnSlise comparativa dos clusters 



deve certamente ao fato de serem os agrupamentos com 
maiores diferengas entre si. A ultima linha resume, para 
cada cluster, a porcentagem dos canais assinalados aquele 
cluster que formam pares (ambos os sentidos, A^-B e 
B^A, no mesmo cluster). 

O cluster 2, que teve a maior quantidade de pares com 
canais tambem atribuidos a outros grupos, foi aquele que 
teve a maior variabilidade (CV), muito acima dos demais. 
Essa maior variabilidade pode ter contribuido para maior 
dispersao dos sens elementos. 



5. CONCLUSAO E TRABALHOS FUTUROS 

Tempos de ida-e-volta sao importantes em diversas si- 
tuafSes na Internet: eles podem, por exemplo, determinar 
a selegao de certos pares ou servidores em aplicagoes dis- 
tribuidas, afetando a forma como participantes do sistema 
se organizam. Por esse motivo, informa96es sobre RTTs 
sao importantes para orientar o projeto de protocolos e 
como entrada para sistemas de simula9ao, entre outros fa- 



tores. Neste trabalho apresentamos um metodologia para 
medigao e caracterizagao de tempos de ida-e-volta na In- 
ternet. As medifoes foram realizadas por um periodo de 
dez dias, com um intervalo entre medigSes baixo (10 se- 
gundos), utilizando 8 1 maquinas distribuidas pela Internet 
em quatro continentes. 

Os resultados foram avaliadas em termos dos RTTs 
medios, sua variabilidade ao longo do tempo entre um 
mesmo par de maquinas e entre pares diferentes, bem 
como as perdas observadas em cada canal de medigao. 
O padrao de variagao dos RTTs ao longo do tempo foi 
modelado como uma distribuigao Gamma, cujos parame- 
tros foram identificados, podendo ser usada na geragao de 
atrasos em ambientes de simulagao, por exemplo. Com 
base no uso de relogios sincronizados avaliamos tambem 
o atraso unidirecional entre as diversas maquinas, encon- 
trando uma prevalencia significativa de assimetria nos ca- 
nais. Finalmente, uma analise dos logs utilizando uma 
tecnica de clusterizagao mostrou a existencia de cinco 
grupos, caracterizados por diferentes combinagoes de va- 
lor medio de RTT, taxas de perda e variabilidade das me- 
digoes, entre outros fatores. A inspegao de algumas amos- 



12 



E. Valadao, D. Guedes, R. Duarte 



Caracter. de tempos de Ida-e-volta na Internet 



tras de cada grupo e a analise das distribui95es acumu- 
ladas das diversas metricas em cada caso confirmam as 
diferen9as entre os grupos e composi96es inter- e intra- 
continentes. 

Identificamos ate o presente momento pelo menos 
duas linhas para trabalhos futures. Por um lado, pretende- 
mos investigar os fatores de rede que levaram a formafao 
dos grupos identificados. Esperamos que isso leve a um 
modelo mais detalhado do comportamento da rede quanto 
aos tempos de ida-e-volta, com caracteriza9ao dos clus- 
ters separadamente. Paralelamente, pretendemos repro- 
duzir o experimento em maior escala, com mais pontos 
de medi9ao e por periodos mais longos. A analise de in- 
tervalos maiores ou variaveis se encontram entre os traba- 
lhos que estamos desenvolvendo no momento, junto com 
o projeto de uma versao adaptativa da malha de monitora- 
9ao que permita a realiza9ao de medidas entre um numero 
maior de maquinas. Para tal, utilizaremos uma topologia 
do tipo par-a-par para minimizar a complexidade quadra- 
tica da quantidade de nos intercomunicantes. 



Disponibilidade dos dados 

O trace completo, bem como os programas de medi- 
9ao e coleta dos TWP podem ser obtidos atraves de con- 
tato com o primeiro autor. Mais informa95es podem ser 
obtidas na pagina do projeto no qual esta pesquisa esta in- 
serida: http : / /www . dec . uf mg . br /-evaladao/ df d 
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